Taalas HC1关键技术与未来Inference晶片架构解析
摘要
Taalas HC1关键技术与未来Inference晶片架构解析 2026年2月20日加拿大AI晶片新创厂商Taalas发布可在Llama 3.1 8B模型实现16,960Tokens/s/user速率的AI晶片Taalas HC1,且不需使用HBM、CoWoS,单一晶片TDP仅约250W;不仅如此,其他Inference晶片新创厂商也在2026年积极推出新品,例如2026年2月24日SambaNova、MatX紧接著分别推出SN50、MatX One晶片,Axelera AI、Positron AI也预计在2026年分别推出Europa、Asimov晶片。
本篇报告主要深度解析:(1)记忆体内运算vs.冯.诺依曼架构;(2) Taalas HC1技术背景;(3)高效率Inference晶片新创厂商比较。期能解析CIM技术与Taalas实现高效率运算的原理、Inference晶片新创厂商的竞争态势,与Inference晶片的未来可能发展。
一. 记忆体内运算vs.冯.诺依曼架构
二. Taalas HC1技术背景
三. 高效率Inference晶片新创厂商比较
四. 拓墣观点
图一 CIM vs. von Neumann Architecture
图二 Taalas HC1 Card
图三 Taalas HC1 Tokens/s/user
图四 各类型AI晶片Inference适用性比较
图五 Taalas HC1 block diagram
图六 Taalas HC1运算过程
图七 Taalas HC1运算过程实例
图八 Three Scaling Laws
图九 Tenstorrent Blackhole晶片架构
图十 Groq LPU晶片架构
图十一 Cerebras WSE-3晶片结构
图十二 SambaNova SN50晶片结构
图十三 Etched Sohu晶片示意图
图十四 d-Matrix Corsair晶片结构
图十五 Untether AI Boqueria晶片结构
图十六 Positron Atlas Server
图十七 Axelera AI Metis AIPU晶片结构
图十八 FuriosaAI TCP晶片结构
表一 CIM技术类型
表二 各AI新创厂商的高效率Inference晶片规格比较
